在本文中,我们在不确定的沟通和对抗性攻击者的影响下解决了多机器人信息路径计划(MIPP)任务。目的是创建一个多机器人系统,尽管存在损坏的机器人共享恶意信息,但仍可以学习并统一对未知环境的知识。我们使用高斯工艺(GP)来对未知环境进行建模,并使用相互信息的指标来定义信息。我们MIPP任务的目标是最大化团队收集的信息量,同时最大程度地提高弹性弹性的可能性。不幸的是,这些目标是矛盾的,尤其是在探索需要机器人之间断开连接的大环境时。结果,我们强加了一个概率的通信约束,该概率可以使机器人间歇性地满足和弹性地共享信息,然后在所有其他时间内采取行动以最大程度地提高收集的信息。为了解决我们的问题,我们选择具有最高弹性概率的会议位置,并使用顺序贪婪算法来优化机器人探索的路径。最后,我们通过比较应用弹性和非弹性MIPP算法的良好行为机器人的学习能力来展示结果的有效性。
translated by 谷歌翻译